l Capítulo 11 


Estadística y Probabilidades 


Introducción 


Generalmente la estadística 
se asocia a un conjunto de datos 
organizados en tablas o en 
gráficos, referentes a geografía, 
demografía, economía, mercados, 
salud, entre otros temas. Pero la 
estadística es mucho más amplia 
de lo que parece. Es una ciencia 
tan antigua como la matemática, 
y por su utilidad, es apoyo de 
todas las demás ciencias. La 
estadística ayuda a que los 
administradores tomen las 
mejores decisiones en tiempos 
de incertidumbre. 


Frecuencia de visitantes 


Cant. de visitantes 


La historia de la estadística se 
resume en tres grandes etapas, 
a saber: 


4:00 a 15:59 


00:00 a 01:59 
02:00 a 03:59 
04:00 a 05:59 
06:00 a 07:59 
08:00 a 09:59 
10:00 a 11:59 
12:00 a 13:59 
16:00 a 17:59 
18:00 a 19:59 
20:00 a 21:59 
22:00 a 23:59 


1 


ora de visita 


Primera Etapa (Los Censos): La necesidad de llevar un control de la 
población y las riquezas existentes en un reino o país es una de las primeras 
aplicaciones de la estadística. De acuerdo al historiador griego Herodoto, 
los faraones lograron recopilar hacia el año 3050 a.C. datos relativos a la 
población y la riqueza de Egipto. Esta etapa se caracterizó por ser netamente 
descriptiva de la información. 


Segunda Etapa (De la descripción de los conjuntos a la aritmética 
política): Luego de superar la etapa descriptiva, surgieron obras como las de 
Graunt, Petty y Halley. El penúltimo es autor de la famosa obra “Aritmética 
Política”. Chaptal, ministro francés del interior, publicó en 1801 el primer 
censo general de población y desarrolló estudios industriales sobre producción, 
haciéndose sistemáticos durante las dos terceras partes del siglo XIX. 
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Tercera Etapa (Cálculo de Probabilidades): El cálculo de 
probabilidades surge como una poderosa herramienta de análisis para 
estudiar fenómenos económicos y sociales, y otros cuyas causas son difíciles 
de controlar. 


Durante cierto tiempo, la teoría de las probabilidades limitó su aplicación 
a los juegos de azar, y hasta el siglo XVIII no comenzó a aplicarse a los 
grandes problemas científicos. 


La estadística que conocemos hoy en día, debe gran 
parte de su realización a los trabajos matemáticos de 
aquellos hombres que desarrollaron la teoría de las 
probabilidades, con la cual se adhirió la estadística a 
las ciencias formales. 


De aquí, que la estadística es la ciencia que recolecta, J 
organiza, describe e infiere información para el análisis Jacques Quetelet, 


matemático 


e interpretación de los fenómenos que nos rodean. A ga 


Al finalizar esta sección el lector podrá: 


* Explicar el rol de la estadística en la sociedad y su aplicación en el 
análisis de información. 


* Distinguir entre estadística descriptiva y estadística inferencial. 


* Identificar los errores más comunes cuando se analiza información 
estadística. 


* Definir los términos estadísticos, los tipos de variables y escalas de 
medición frecuentemente más empleados. 


La estadística es la ciencia cuyo objetivo es reunir información cuantitativa 
concerniente a individuos, grupos, series de hechos, etc., para deducir de su 
análisis, conclusiones precisas o previsiones para el futuro. 


Algunos confunden comúnmente los términos asociados con la estadística, 
debido a que esta palabra etimológicamente tiene tres significados: en 
primer término se usa para referirse a la información estadística; también se 
utiliza para referirse al conjunto de técnicas y métodos que se utilizan para 
analizar la información estadística; y el término estadístico, en singular y en 
masculino, se refiere a una medida derivada de una muestra. 
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Para su mejor estudio, la estadística se ha dividido en dos grandes ramas: la 
estadística descriptiva y la estadística inferencial. 


La estadística descriptiva consiste en la presentación de datos en forma 
de tablas y gráficas. Esta comprende cualquier actividad relacionada con 
los datos y está diseñada para resumir o describir los mismos sin factores 
pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá 
de los datos como tales. 


Los métodos estadísticos tradicionalmente se utilizan para propósitos 
descriptivos, para organizar y resumir datos numéricos. La estadística 
descriptiva trata de la tabulación de datos, su presentación en forma gráfica 
o ilustrativa y el cálculo de medidas descriptivas. 


Estas técnicas estadísticas se aplican de manera amplia en control de calidad, 
contabilidad, mercadotecnia, estudios de mercado, análisis deportivos, 
administración de instituciones, educación, política, medicina, y por aquellas 
personas que intervienen en la toma de decisiones. 


La estadística inferencial se deriva de muestras, que son subconjuntos 
de una población con alguna característica de interés. A partir de las 
observaciones hechas a una parte de un conjunto numeroso de elementos, 
se infiere acerca de las características que posee la población. Esto implica 
que su análisis requiere de generalizaciones que van más allá de los datos. 


Como consecuencia, la característica más importante del reciente crecimiento 
de la estadística ha sido un cambio en el énfasis de los métodos que sirven 
para hacer generalizaciones. La estadística inferencial investiga o analiza 
una población partiendo de una muestra tomada. 


El método estadístico es el conjunto de los procedimientos que se 
utilizan para medir las características de los datos, para resumir los valores 
individuales y para analizarlos, a fin de extraerles el máximo de información; 
es lo que se conoce como método estadístico. 


Un método estadístico contempla las siguientes seis etapas: 


. Definición del problema. 

. Recopilación de la información existente. 

. Clasificación y control de calidad de los datos. 
. Codificación y digitación. 

. Análisis. 


DD 4 bh LUNG 


. Presentación. 
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Errores estadísticos comunes. Existe la posibilidad de cometer errores 
al momento de recopilar los datos que serán procesados, así como durante 
el cómputo de los mismos. No obstante, hay otros errores que no tienen que 
ver con la digitación y no son tan fáciles de identificar. 


Algunos de estos errores son: 


=" Sesgo: Hay que ser completamente objetivo y no tener ideas 
preconcebidas antes de comenzar a estudiar un problema, evitando que 
puedan influir en la recopilación y en el análisis de la información. En 
estos casos se dice que hay un sesgo cuando el individuo da mayor peso 
a los datos que apoyan su opinión, que a aquellos que la contradicen. 
Un caso extremo de sesgo sería la situación donde primero se toma 
una decisión y después se utiliza el análisis estadístico para justificar la 
decisión ya tomada. 


=" Datos no comparables: Establecer comparaciones es una de las 
partes más importantes del análisis estadístico, pero es extremadamente 
importante que tales comparaciones se hagan entre datos que se presten 
a ello. 


=" Proyección descuidada de tendencias: La proyección simplista de 
tendencias pasadas hacia el futuro, es uno de los errores que más ha 
desacreditado el uso del análisis estadístico. Hay que tener en cuenta que 
cualquier estadística que se realice es una fotografía instantánea, por lo 
cual deben emplearse los históricos de otras estadísticas previamente 
realizadas antes de emitir cualquier resultado concluyente sobre el 
fenómeno o hecho que se está estudiando. 


=" Muestreo incorrecto: En la mayoría de los estudios, la información 
disponible es tan extensa que se hace necesario inferir a partir de 
muestras, para derivar conclusiones acerca de la población a la que 
pertenece la muestra. Si la muestra se selecciona correctamente, 
tendrá básicamente las mismas propiedades que la población de la cual 
fue extraída; pero si el muestreo se realiza incorrectamente, entonces 
puede suceder que los resultados no sean representativos de la realidad 
poblacional. 


Cabe anotar que en este texto nos limitaremos a tratar la estadística 
descriptiva, para lo cual definiremos algunos conceptos básicos asociados a 
esta rama. 


Elemento o ente: Cualquier elemento que aporte información sobre la 
característica que se estudia. Así, si estudiamos la altura de los niños de una 
clase, cada alumno es un ente; si estudiamos el precio de la vivienda, cada 
vivienda es un ente. 
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Población: Conjunto o colección de los entes de interés. Cada ente 
presenta características determinadas, observables y medibles. Por ejemplo, 
en el elemento persona: nombre, edad, género, peso, nacionalidad, etc. 
Por lo tanto, la estadística se preocupa de estudiar las características de los 
elementos constituyentes de la población, y estudia las posibles relaciones y las 
regularidades que presenta la población a partir de estas características. 


La población se puede clasificar, según su tamaño, en dos tipos: 


=" Población finita: El número de elementos es finito. Por ejemplo: la 
cantidad de alumnos de una escuela. 


=" Población infinita: El número de elementos es infinito o tan grande 
que pueden considerarse en cantidad infinita. Por ejemplo: las estrellas 
de la Vía Láctea. 


Muestra: La mayoría de los estudios estadísticos, no se realizan sobre la 
población por los altos costos en tiempo y dinero, sino sobre un subconjunto 
o una parte de ella denominada muestra, partiendo del supuesto de que 
este subconjunto presenta el mismo comportamiento y características de la 
población. Por ejemplo, para la población “estudiantes de las escuelas de 
Guayaquil”, una muestra podría ser “el conjunto de niños de una escuela en 
particular”. 


Variable: Es una característica que se asocia a los elementos de una 
muestra o población. Tiene la propiedad de poder ser medida u observada. 
Su expresión numérica es el dato. Las variables se pueden clasificar en dos 
tipos: 


Variables cuantitativas: Se expresan por medio de números y pueden ser: 


=" Discretas: Sólo se miden por medio de valores puntuales. Por ejemplo: 
número de materias, cantidad de médicos en un hospital; y, 


= Continuas: Pueden tomar cualquier valor intermedio entre dos 
números, es decir, intervalos. Por ejemplo: el peso y la estatura de una 
persona. 


Variables cualitativas o atributos: No se pueden expresar numéricamente, sino 
por medio del nombre de la característica en estudio; se pueden clasificar en: 


=" Ordinales: Aquellas que sugieren una ordenación. Por ejemplo: nivel 
de estudio, posición de los ganadores de un concurso; y, 
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= Nominales: Aquellas que sólo admiten una mera ordenación alfabética, 
pero no establecen orden por su contenido. Por ejemplo: género, estado 
civil, color de cabello. 


Las variables también se pueden clasificar en: 


=" Variables unidimensionales: Sólo recogen información sobre una 
característica. Por ejemplo: edad de los alumnos de una clase. 


=" Variables bidimensionales: Recogen información sobre dos 
características de la población. Por ejemplo: edad y estatura de los 
alumnos de una clase. 


=" Variables multidimensionales: Recogen información sobre tres o 
más características. Por ejemplo: edad, estatura y peso de los alumnos 
de una clase. 


Existen otros tipos de variables que se emplean en estadística, como son 
las variables independientes, variables dependientes, variables explicativas, 
variables de respuesta, entre otras, que no forman parte del estudio de este 
capítulo, pero que se pueden analizar con más detenimiento en un curso 
formal de estadística. 


Antes de realizar un estudio estadístico, es importante tener claridad 
respecto de aspectos tales como: ¿qué se está midiendo?, ¿cómo se está 
midiendo?, ¿para qué se está midiendo?, ¿por qué se está midiendo?, ¿quién 
está midiendo?, ¿en qué momento se realizarán las mediciones? En síntesis, 
el proceso de medición genera el tipo de variable y no su característica o 
propiedad por la cual está siendo estudiada. 


Escala de medición de variables 


Entenderemos por medir, el proceso que se realiza al asignar números a 
objetos, fenómenos o características, según ciertas reglas de cuantificación. 
Se asocia un número y sólo uno (correspondencia biunívoca) al objeto o 
fenómeno que se quiere medir. 


Toda medida de una variable está referida a una escala, que es una regla o 
patrón que permite asociar números a los objetos o fenómenos. Los tipos de 
medida están representados en el siguiente cuadro: 
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Ordinal |Se pueden establecer relaciones de 
orden entre los datos de la variable: 
mayor, menor o igual. Contiene a la 
escala nominal. 


De Ordenan las medidas y permiten 
intervalo | realizar comparaciones entre dos 
medidas. Usan un cero relativo. 


De razón |Se pueden establecer razones entre 
los datos. Posee cero absoluto. 


Al finalizar esta sección el lector podrá: 


Nivel socio económico: 
alto/medio/bajo. 


Rendimiento académico: 
excelente/regular/ 
deficiente. 


Temperatura: 
OA ls e 


El rendimiento en una 
prueba puede estar en 
el intervalo [0, 20]. 


Peso, estatura. 


* Dado un conjunto de datos, organizar la información empleando 


tablas de frecuencia. 


* Interpretar información estadística en forma tabular a nivel de 


frecuencia relativa y frecuencia acumulada. 


Una vez que las variables han sido medidas, estos valores pasan a constituir el 
conjunto de datos estadísticos, que deberán ser procesados y analizados por 
el investigador. Para el efecto, existen algunas técnicas que serán estudiadas 


en esta sección. 


Según el número de observaciones y el rango de la variable, podemos 


clasificar las tablas de la siguiente manera: 


Tablas de tipo l: El tamaño de la población o muestra es pequeño. Por 
ejemplo, las edades de 6 personas: 15, 18, 19, 21, 24, 28. Sólo se ordenan 


de manera creciente o decreciente. 


Tablas de tipo Il: El tamaño de la población o muestra es grande y el 


rango de la variable es pequeño. 


El número diario de llamadas telefónicas realizadas en una casa durante 
30 días, se encuentra tabulado así: 


Sea la variable el número diario de llamadas telefónicas, podemos 
observar que el rango de la variable está entre 1 y 5 llamadas, y que 
el total de datos es 30 llamadas. Por lo tanto, la tabla de frecuencia se 
estructura siguiendo los pasos 1 y 2: 


1. Ordene los datos en forma decreciente o creciente por cada 


columna y realice el conteo: 
N°. de 
Conteo 
llamadas 


2. Estructure la tabla de frecuencia relacionando el conteo con un 
número (frecuencia): 


Tablas de tipo III (Tabla de intervalos): El tamaño de la población o 
muestra es grande y el rango de la variable es grande. 


La edad de un grupo de 30 personas se encuentra tabulada así: 


e] a Je] =J»]o. 
o] [=p 
afefe efef 


so | 27 | 14 16 | 30 | 26 
JODE 


Sea la variable, la edad de las personas, observamos que los valores 
están dispersos y que el rango de la variable está entre 5 y 55, por 
lo cual, si se quiere elaborar una tabla, ésta debe ser de intervalos. 
Ahora, los pasos que se deben seguir son: 


1. Determine el total de datos. En este caso N = 30. 


2. Calcule el rango R de la variable con la expresión R =X má — Amínr 
en los cuales están considerados el valor máximo y mínimo de 
dicha variable. Para el ejemplo, R = 55 — 5 = 50. 


3. Determine el número de intervalos, entre 10 y 15. En este ejemplo, 
se tomarán 13 intervalos. 


E R 
NY, Intervalos’ 


4, Calcule la amplitud de los intervalos i 


aproximando al entero más cercano. Para el ejemplo, i = £ =4, 
5. Construya la tabla considerando que los intervalos serán siempre 
cerrados por la izquierda y abiertos por la derecha [L;-ı, Li). 
Para el primer intervalo [£;,, L2), Lı es el mínimo valor de los 
datos y L,es igual a Lı + i. Para el segundo intervalo [L,, L; ), Lz 
ya se determinó en el paso anterior y Lzes igual a L, + i. Este 
procedimiento se sigue realizando para los nuevos intervalos. 


Para el ejemplo, la tabla sería: 


Intervalos de 
edades 


[9, 13) 
[13, 17) 
[17, 21) 
[21, 25) 
[25, 29) 


[41, 45) 
[45, 49) 


Tablas de distribución de frecuencias: Generalmente, las tablas de 
tipo II y I se completan con distintos tipos de frecuencias, tales como: 


a) Frecuencia absoluta: Es el número de veces que aparece dicho valor, 
como resultado de la medición de la variable. Se denota por f;. 


b) Frecuencia absoluta acumulada: Es el resultado de sumar a la 
frecuencia absoluta del valor correspondiente la frecuencia absoluta del 
valor anterior. Se denota por F}. 


c) Frecuencia relativa: Es el cociente entre la frecuencia absoluta y 


el tamaño de la muestra o población: m=É, donde N = Tamaño de la 
muestra o población. Se denota por h;. 


d) Frecuencia relativa acumulada: Es el resultado de sumar a la 
frecuencia relativa del valor correspondiente la frecuencia relativa del 
valor anterior. Se denota por H;. 
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Modelos de tablas estadísticas 


Tablas de tipo Il (Variable cuantitativa discreta) 


Variable | Frecuencia | Frecuencia | Frecuencia Frecuencia 
absoluta absoluta relativa relativa 
(4) acumulada acumulada 
(F) (4) 


Ejemplo 11.3 Tabla de frecuencias. p mmn 
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N°. de |Frec. abs.| Frec. abs. Frec. rel. Frec. rel. 
llamadas (fi) acumulada j acumulada 
i (i 


o0 
is 


— 
n 


iS 


E ES 
I 
> 
N 


T 
NO) 


(09) 
ES 
=a 
¡97 


UI 
© 

l 
oļ|— 


= 
S 


Tablas de tipo III (Variable cuantitativa continua) 


Intervalos Marca Frec. Frec. abs. Frec. Frec. rel. 
de la de clase abs. acumulada rel. acumulada 


Variable G) (F,) (h, F (4,) 


[ao, a1) 


do 


Ía ——=— =% 


(e 1 SF a;) 
2 


[a 1» Q a) > 


[az 1, akl 
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La marca de clase (Xyc) representa los datos que se agrupan en ese intervalo 
(clase). Es el valor promedio entre los dos límites del intervalo. A diferencia 
de la tabla anterior, la tabla de intervalo es menos precisa en la determinación 
de los datos que pertenecen a una clase o intervalo. 


A la tabla original del ejemplo 11.2 se le agregan tres columnas: 
frecuencia absoluta acumulada (+), frecuencia relativa (hi) y frecuencia 


relativa acumulada (Hi). 


0.067 | 0.067 


0.134 
0.234 


Intervalos de 
edades 


[5 2) 
[9, 13) 
[13, 17) 
MAN 
21,25) 


[25, 29) 


0.334 
0.401 
0.601 
0.668 
0.701 
0.768 
) 
V 


(29755) 
LoM) 
[37, 41) 
[41, 45) 
[45, 49) 
[49, 53) 
[53, 57] 
Total 


0.868 
0.901 
0.967 
1.000 


La interpretación de la cuarta fila de esta tabla sería: 


F, = 10, significa que existen 10 personas con edades comprendidas 
entre 5 y 21 (de edades mayores o iguales que 5 años y menores que 
21 años). 


ha = 0.100, significa que las tres personas cuyas edades están 
comprendida en el intervalo [17, 21) representan el 10% del total. 


H, = 0.334, significa que el 33.4% de las personas tienen edades 
comprendidas entre 5 y 21 años. 


En un estudio realizado a 40 personas acerca del nivel de cotinina, se 
obtuvieron los siguientes resultados: 


¡ALO 35 I0 I0 253 123 86 
0 44 112 222 234 87 167 284 
131 277 477 149 164 121 250 1 
178 3A WWO SOS 2000 MS ME 
265 3 L2 Ail Iy 29W 48 173 


Construya una tabla de frecuencias. 
Solución: 


El total de datos con el que se va a trabajar es N = 40. El rango 
R = 491 — 0 = 491. 


Trabajaremos con 5 intervalos. Por lo cual, la amplitud de los intervalos: 


i= H L 98.2 = 100 


Vamos a redondear a 100 la amplitud de los intervalos por ser un valor 
conveniente. 


Marca | Frec. | Frec. abs. - Frec. rel. 

Intervalos . | acumulada : acumulada 
de la 
Variable 


l 0.275 
, 400) 


[300, 400 
[400, 500] 


EAE S] 


Determine los valores que hacen falta para completar la siguiente tabla 
de frecuencias: 


Intervalos Frec. abs. Frec. 
de la acumulada | relativa 


Variable (F) (UN) 


| (10) [| 60 | 60 | mu | 


SA A 


Solución: 


Primero determinemos F3. Para esto, se conoce que: F; =f; + F, luego: 
F= 170 - 30 = 140. 


Para calcular f, tenemos que 60 + f, = F>, por lo que f = 140 — 60 = 80. 
Como N = 200, para calcular f4, partimos de la definición de h4: 
m=% Sja = ma N= 01 20020 


El valor de F, lo determinamos sumando F; + f4, así: 


JE = ER 
= 170+20 
Fa = 190 


Siguiendo el mismo procedimiento, determinamos fs: 


Js => ES En 
= 200-— 190 
En 


Al haber calculado todas las frecuencias absolutas, podemos obtener 
las frecuencias relativas, dividiéndolas para N: 


60 
h¡= 2007 0.3 
30 
h3= 2007 0.15 
hs A = (0,05 


~ 200 


Escribimos entonces la tabla completa: 


Intervalos Frec. abs. Frec. 
de la acumulada | relativa 


Variable (F) (h;) 


moe 
[10, 20) 80 | 
[20, 30) 


[40, 50] 


Al finalizar esta sección el lector podrá: 


* Dada un conjunto de datos, representar la información utilizando 
histogramas de frecuencias, poligonales de frecuencias y diagramas 
de tallo y hojas. 


* Interpretar información estadística en forma gráfica. 


Al leer un diario o alguna revista, es común encontrarnos con algún tipo de 
estudio o reportaje cuyos resultados se muestren en tablas y/o gráficos. Es 
importante, saber representar, leer e interpretar la información que se nos 
proporciona de esta forma, reconociendo las variables consideradas, tanto 
lo que se representa en los ejes como el significado de los cambios en los 
valores de las variables. 


Los gráficos permiten formarnos una impresión inmediata acerca del 
comportamiento de las variables estudiadas, destacando sus características 
más relevantes. 


Histograma: Es un gráfico de barras (sin espacios entre ellas), formado por 
rectángulos, cuya base está dada por la amplitud de cada intervalo y cuyas 
alturas corresponden a las frecuencias (frecuencias absolutas o relativas) 
alcanzadas por dichos intervalos. 


Con los datos organizados en la tabla adjunta, se construye un 
histograma de frecuencias como se muestra a continuación: 


presión | s 


Poligonal de frecuencias: Se obtiene al unir las marcas de clases con las 
frecuencias respectivas, formando un par ordenado. La poligonal formada 
uniendo estos puntos, se cierra juntando los extremos con las marcas de 
clase del intervalo anterior al primero y del siguiente al último. 


0 Presión 
86 95 104 113 


Cantidades de observaciones 


Respecto al ejemplo anterior, la marca de clase de cada intervalo se 
muestra a continuación: 


presión | 4 | Xu 


LE 


Cantidades de observaciones 
V 
o 


Diagrama de tallo y hojas: Este diagrama permite apreciar la variabilidad 
o dispersión de los datos. 


56 


13 


Para este caso, la parte entera de la nota constituye el tallo, y las hojas 
son las cifras decimales de cada nota. En el lado izquierdo están las 
notas del primer semestre y en el lado derecho están las notas del 
segundo semestre. En el ejemplo, el gráfico permite la comparación 
visual de la distribución de las notas por semestre. El diagrama de tallo 
y hoja es el siguiente: 


I Semestre Tallo II Semestre 


© 5 
Maa SO 0 
A A a a 
~o 3 00 
oo O 
DAS SO A O 


Hojas Tallo Hojas 


En la tabla a continuación se describe el peso en kg. de 36 personas. 


IOS LA MI 
A as A LE S aS 
IBe 22 o AS AS 
les i eS AS ky AO 
lsd EA s lG lgo QA 
¡SMS Iye A6 Ie lss W3 


Construya el diagrama de tallo y hojas. 
Solución: 


Si seleccionamos como valores del tallo los números 7, 8, 9, ..., 18, 19, el 
diagrama de tallo y hojas resultante si leemos los datos por filas, sería: 


Tallo Hojas Frecuencias 


| 
| 
| 


7 6 

8 9,7 

9 7,4 

KORS TORS 
MES 
12332 

13 1,1,5,4 
14 S o 000. 
157,4, 1:33 
16 3,0 
IESO ES 

18 8,0,3 
IS 


N U UNAUA Bb NNU NN o 


11.4 Medidas de tendencia central y no central 


Objetivos AA 


Una medida de tendencia central es un número (estadígrafo) que se considera 
representativo de todos los números en un conjunto de datos. 


Media aritmética (x) 


Se define como el cuociente entre la suma de los valores que toma la 
Xi X2 + X3 +... +H Xn 


variable (datos) y el total de observaciones: x = Al ; siendo 
n 
Y 

n el total de observaciones, también se puede expresar como == ; 


generalmente esta definición se ocupa para datos no tabulados. Para datos 
tabulados en tablas tipo II la media aritmética se obtiene por medio de: 


k 
D Ge o) 2 Cuc Ji) 


y en tablas de tipo II se obtiene mediante x = = E 7 


Dentro de las propiedades de la media aritmética se tiene que si se dividen 
o multiplican todos los datos por una constante, la media aritmética queda 
dividida o multiplicada, respectivamente, por esa constante; lo mismo que 
sucede si se le suma o resta una constante. 


Sin embargo, la media aritmética presenta el problema de que su valor se 
puede ver influenciado por valores extremos, que se aparten en exceso del 
resto de la serie. Estos valores anómalos podrían condicionar en gran medida 
el valor de la media aritmética, haciéndole perder representatividad. 


Ejemplo 11.11 Media aritmética para datos no tabulados. ns 
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567 + 683 + — OSSO —- -645.2 
En este caso, se puede decir que el sueldo promedio que paga la 
empresa a sus cinco empleados es de $645.2 . 


La media aritmética es x = 


Xmc corresponde a la marca de clase del intervalo y se encuentra como 
la media aritmética de los límites superior e inferior de cada intervalo. 


Por ejemplo, la marca de clase para el primer intervalo de la tabla 
1005430 = 425 


| Sueldos | fi | Xuc | firXwc| 


adjunta se encuentra como: 


La media aritmética es: 


_ (10(425H20)(475}80)(525)H40)(575)(15X(625)}+(10)(675}5)(775) 


xI 


130 
_ 4250 +9500 + 15750 + 23000 + 9375 + 6750 + 3875 
Da 130 

- 72500 

e 


Se define como el valor central de una distribución que tiene un número impar 
de datos, una vez ordenados los datos de manera creciente o decreciente. El 
dato que representa la mediana divide la distribución en dos grupos, un 50% 
de valores son inferiores y otro 50% son superiores. 


Si el número de datos (N) de la distribución es par, la mediana está dada por 
el promedio de los dos datos centrales. 


La mediana no presenta el problema de estar influenciada por los valores 
extremos, pero en cambio no utiliza en su cálculo toda la información de 
la serie de datos (no pondera cada valor por el número de veces que se ha 


repetido). 
Si N es impar, el término central es el dato que ocupa ese lugar: 


X=X(N+ 1) 
p 


Considere los siguientes datos: 2, 4, 5, 9, 10. 


2 2 2 


Si N es par, existen dos datos centrales: xy Y Xy E 
5 5+ 
2 2 


XytXN 
2 2 


n 


Considere los siguientes datos: 2, 4, 5, 9, 10, 12 


Aquí N=6 


Xy == E 
2 
¡== 


Se define como el valor de la variable con mayor frecuencia absoluta, o el 
valor que más se repite. Puede haber más de una moda; para el caso que 
existan dos, se tiene una distribución bimodal; para más de dos, polimodal. 


Si 60, 75, 75, 80, 90, 90, 100 representan las notas de un estudiante, 
tenemos 2 modas: 75 y 90. La distribución de estos datos es bimodal. 


De acuerdo a los datos que se presentan en el ejemplo 11.10, determine 
las medidas de tendencia central. 


Solución: 


Como primer paso, ordenemos los 36 datos por columna, lo cual se 
presenta en la siguiente tabla: 


| 89 


Media aritmetica OO: E OA 060 


Ei ss 


La mediana X = 


La moda, el valor de mayor frecuencia, es 13.1. 


En la siguiente tabla se describe los resultados agrupados de un estudio 
a 40 personas sobre el nivel de cotinina: 


Nivel de 
[0, 100) 
[100, 200) 1800 


| [400,500) | 2 |  «4s0 | 90m 
IA ON E A 


La media aritmética es: 


y — (11X50) + (12X150) + (14)(250) + (1)350) + (21450) 
40 


y 550 + 1800 + 3500 + 350 + 900 
40 


=177.5 


Considere los siguientes datos: 10, 15, 16, x, 20, 22. Si se conoce que 
la mediana es igual a 17.5, entonces determine el valor del dato x. 


Solución: 


Como N es igual a 6, una cantidad par, entonces la mediana es: 


Vr ae 
a 2 PA E. 
2 2 Í 
l6+x=35 
x=19 


También denominadas medidas de localización, permiten conocer otros 
puntos característicos de la distribución que no son los valores centrales. 
Entre otros indicadores, se suelen utilizar una serie de valores que dividen la 
muestra en tramos iguales: 


Cuartiles: Son 3 valores que distribuyen la serie de datos, ordenada de 
forma creciente o decreciente, en cuatro tramos, en los que cada uno de 
ellos concentra el 25% de los datos. 


Deciles: Son 9 valores que distribuyen la serie de datos, ordenada de 
forma creciente o decreciente, en diez tramos, en los que cada uno de ellos 
concentra el 10% de los datos. 


Percentiles: Son 99 valores que distribuyen la serie de datos, ordenada de 
forma creciente o decreciente, en cien tramos, en los que cada uno de ellos 
concentra el 1% de los datos. 


Vamos a calcular los cuartiles de la serie de datos referidos a la estatura 
en metros de un grupo de alumnos. Los deciles y percentiles se calculan 
de igual manera, aunque harían falta distribuciones con mayor número 
de datos. 
Variable Frecuencias absolutas Frecuencias relativas 
- (Valor en m) Simple Acumulada Simple Acumulada 
1/30 1/30 
4/30 5/30 
[o A E] 4/30 9/30 
2/30 11/30 
1/30 12/30 


1° cuartil: Es el valor 1.22m, ya que por debajo suyo se sitúa el 25% 
de la frecuencia acumulada (tal como se puede ver en la columna de la 
frecuencia relativa acumulada). 


2” cuartil: Es el valor 1.26m, ya que entre este valor y el 1° cuartil se 
sitúa otro 25% de la frecuencia acumulada. 


3” cuartil: Es el valor 1.28m, ya que entre este valor y el 2° cuartil se 
sitúa otro 25% de la frecuencia acumulada. Además, por encima suyo 
queda el restante 25% de esta frecuencia. 


Observación: Cuando un cuartil recae en un valor que se ha repetido 
más de una vez, como ocurre en este ejemplo, la medida de posición 
no central sería realmente una de las repeticiones. 


11.5 Medidas de dispersión 
Objetivos AA 


Las medidas de dispersión estudian la distribución de los valores de la 
serie, analizando si éstos se encuentran más o menos concentrados, o más 
o menos dispersos. 


Existen diversas medidas de dispersión, entre las más utilizadas podemos 
destacar las siguientes: 


Rango: Mide la amplitud de los valores de la muestra y se calcula por la 
diferencia entre el mayor valor y el menor. 


Varianza: Mide la distancia existente entre los valores de la serie y la media 
aritmética. Se calcula como la sumatoria de las diferencias al cuadrado 
entre cada valor y la media, multiplicadas por el número de veces que se 
ha repetido cada valor. La sumatoria obtenida se divide por el tamaño de la 
muestra. 


Si el número de datos es pequeño, es recomendable utilizar (n — 1) en vez de 
n en el denominador de la expresión anterior. 


La varianza siempre será mayor que cero. Mientras más se aproxima a cero, 
más concentrados están los valores de la serie alrededor de la media. Por el 
contrario, mientras mayor sea la varianza, más dispersos están. 


Desviación típica o estándar: Se calcula como la raíz cuadrada de la varianza. 


Ejemplo 11.20 Medidas de dispersión. AA 
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Variable Frecuencias absolutas Frecuencias relativas 
(Valor enm) Simple Acumulada Simple Acumulada 
E A E] E 
Rango: Diferencia entre el mayor valor de la muestra (1.30) y el menor 

valor (1.20). Luego el rango de esta muestra es 0.1m o 10cm. 


Varianza: La media aritmética de esta muestra es 1.253m. Luego, 
aplicamos la expresión: 


ya -((1.20-1.253)P1)+((1.21-1.253)?*4)+((1.22-1.253)?*4)+..-+((1.30-1.253)9*3) 
30 


Por lo tanto, la varianza es 0.0010 . 
Desviación típica: Es la raíz cuadrada de la varianza. 
S= 5 


Luego: 


S = 10.010 = 0.0320 


Al finalizar esta sección el lector podrá: 


* Explicar los elementos que definen un espacio muestral. 


* Dadas las condiciones de un experimento aleatorio, describir su 
espacio muestral. 


* Dadas las condiciones de un experimento aleatorio, calcular la 
probabilidad clásica de que ocurra un evento requerido. 


La rama de la matemática conocida actualmente como probabilidad consiste 
en el estudio de ciertos experimentos llamados aleatorios, es decir, libres de 
determinación previa. La probabilidad surgió a comienzos del siglo XVI, en 
relación con los diversos juegos de azar que se practicaban en la época, más 
aún, desde civilizaciones tan antiguas como las de los sumerios y egipcios. 
Hoy en día, los juegos de azar están presentes en aquellos como loterías, 
juegos de casino y de naipes, muy populares en nuestra sociedad actual. Así, 
el cálculo de probabilidades determina las posibilidades de ganar o perder en 
un evento específico. En general, el estudio de las probabilidades permite el 
análisis de resultados relacionados con fenómenos de carácter social, político 
y económico, entre otros. 


Un experimento aleatorio es aquel que está regido por el azar, es decir, 


se conocen todos los resultados posibles, pero no es posible tener certeza de 
cuál será en particular el resultado del experimento. 


= Lanzamiento de un dado. 

= Lanzamiento de una moneda. 

= Lanzamiento de dos monedas. 

= Extracción de una carta de un mazo de naipes. 


Se denomina espacio muestral (Q) asociado a un experimento aleatorio, 
al conjunto de todos los resultados posibles de dicho experimento. 


= Al lanzar un dado, el espacio muestral es: 
A o le. 

= Al lanzar una moneda, el espacio muestral es: 
CS 


Donde: c: cara 
s: sello 


= Al lanzar dos monedas, el espacio muestral es: 


Q = {(c, c), (c, s), (s, c), (s, s)} 


Observe que el resultado (c, s) Æ (s, c), es decir, es importante el 
orden. 


= Al extraer una carta de un mazo de naipes, el espacio muestral consta 
de 52 elementos. 


Se denomina evento o suceso a todo subconjunto de un espacio muestral. 


En el espacio muestral Q = (1, 2, 3, 4, 5, 6), relacionado con el 
lanzamiento de un dado, los siguientes son eventos: 


= Obtener un número primo: 
A= I d9 


= Obtener un número primo y par: 
B= (2; 


= Obtener un número mayor o igual que 5: 
T= 15,0} 


Dos eventos son mutuamente excluyentes si no pueden ocurrir en forma 
simultánea, es decir, si y sólo si su intersección es vacía. 


= En el lanzamiento de un dado, los eventos: 


A: obtener un número par. 
B: obtener el número 3. 


A y B son mutuamente excluyentes. 


El espacio muestral es Q = {1, 2, 3, 4, 5, 6}, y los eventos son: 
AA OY B= 


Como A A B = Ø, A y B son mutuamente excluyentes. 


= En el lanzamiento de una moneda, los eventos: 


A: obtener cara. 
B: obtener sello. 


A y B son mutuamente excluyentes. 

El espacio muestral es Q = {c, s}, y los eventos son A= {c} y B= {s}. 
Como A A B = Ø, A y B son mutuamente excluyentes. 

En este último caso, además A U B = Q, por lo que A y B se 
denominarán eventos complementarios, es decir, un evento es el 


complemento del otro: 


ABB ZAN 


Si en un experimento aleatorio todos los resultados son equiprobables (igual 
probabilidad), es decir, la ocurrencia de uno es igualmente posible que la 
ocurrencia de cualquiera de los demás, entonces la probabilidad de un 
evento A es la razón: 


P(A) = Números de casos favorables para A 
Números total de casos posibles 


Ésta es la probabilidad clásica o de Laplace. A partir de ella, las 
probabilidades de los posibles resultados del experimento se pueden 
determinar a priori, es decir, sin realizar la experiencia. 


Un experimento consiste en lanzar dos dados. Se pide realizar lo 
siguiente: 
a) Elaborar el espacio muestral del experimento. 


b) Hallar la probabilidad de que al lanzar los dos dados, la suma de 
las caras de los dados sea igual a 10. 


c) Hallar la probabilidad de que al lanzar los dos dados, la suma se 
encuentre entre 7 y 9, inclusive. 


Solución: 


a) 


b) Sea A: El evento que la suma de las caras de los dados sea igual a 10. 


Las combinaciones que cumplen con esta condición son: 
A= ((4, 6), (5, 5), (6, 4)). 


P(A) = — S 8.33% 


c) Sea B: El evento que la suma de las caras de los dados se 
encuentre entre 7 y 9 inclusive. 


Las combinaciones que cumplen con esta condición son: B = {(1, 6), 
(2,5), 2,6), (3,4), 6,3), 84,6), (4,3), (4,4), (4,5), 6,2), 5,3), 5,4),.(6,1), 
(6,2), (6,3);. 


P(B)- = 2 9 41.67% 


Una comisión ecuatoriana está formada por 20 personas: 8 
representantes de la Sierra, 5 de la Costa, 4 del Oriente y 3 de la 
región Insular. Hallar la probabilidad de seleccionar una persona y que 
ésta sea: 


a) De la Sierra. 
b) De la Costa. 
c) Del Oriente o de la región Insular. 


Solución: 


a) Sea A: El evento de seleccionar una persona de la Sierra entre los 
miembros de la comisión. 


PA) == 940% 


b) Sea B: El evento de seleccionar una persona de la Costa entre los 
miembros de la comisión. 


O Y o 
PB) => 4 S2 
c) Sea C: El evento de seleccionar una persona del Oriente o de la 
región Insular. 


Como existen 4 personas del Oriente y 3 de la región Insular, por 
el principio aditivo, existen 7 formas diferentes de seleccionar una 
persona entre éstas. 


P(C) = 7 = 935% 


Dada la siguiente figura, hallar la probabilidad de seleccionar un punto 
al azar que se encuentre en la región sombreada. 


Solución: 


Si denotamos por E al conjunto de los puntos interiores al círculo 
de longitud de radio r y denotamos por I al conjunto de los puntos 
interiores al círculo concéntrico de longitud de radio l, tal como se 
muestra en la siguiente figura: 2 
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Sea A: El evento de seleccionar un punto al azar que se encuentre en I. 


2 
área de I n(3-) 1 
_ áreadel _ o 
A deE wr Ta 


11.7 Conjuntos y probabilidades 
Objetivos 


Al finalizar esta sección el lector podrá: 


* Aplicar la teoría de conjuntos al cálculo de probabilidades. 

* Calcular probabilidades de eventos dependientes e independientes. 

* Dadas las condiciones de un experimento aleatorio, calcular la 
probabilidad de un evento requerido mediante un diagrama de 
arbol o un triángulo de Pascal. 


Conociendo que (2 constituye un espacio muestral, se pueden describir los 
resultados posibles de un experimento aleatorio en términos de conjuntos, 
de la siguiente manera: 


= AUB: Al menos uno de los eventos A o B ocurre. 
Q 


= AOB: Ambos eventos ocurren. 


Q 
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= AC: El evento A no ocurre. 
Q 


AC 


= ACB: Si el evento A ocurre, entonces el evento B también ocurre. 
Q 


B 


En el experimento del lanzamiento de un dado, sean: 


Evento A: Obtener un número par. 
Evento B: Obtener un número primo. 
Evento C: Obtener un número distinto de 3 ó 5. 


El espacio muestral es Q = {1, 2, 3, 4, 5, 6}. 


4 5 


Obtener un número par o un número primo; se puede representar 
mediante el conjunto AUB, cuyo diagrama de Venn es: 


Q 


AOB = (23,4 56) 
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Si Q es un conjunto de n elementos y A un subconjunto de k elementos, 
entonces la probabilidad de A es: 


Propiedades 


Foz] 
En el lanzamiento de un dado, para el evento A: obtener un número natural 


menor que 7, el conjunto es A= (2 = [1, 2, 3, 4, 5, 6) y su probabilidad es: 
P(A) = g =i 


En el lanzamiento de un dado, para el evento B: obtener un múltiplo de 4 
mayor que 6, el conjunto B = [ } = Ø, y su probabilidad es: 


PB) =PØ)=2=0 


La probabilidad de un evento A es un número real entre 0 y 1. 


= [ si anb=9] (A y B se excluyen mutuamente), entonces: 


En el experimento de extraer una carta al azar de un mazo normal de 52 
cartas, los eventos A: Obtener un 5 y B: Obtener un AS, no pueden ocurrir 
simultáneamente, entonces decimos que son mutuamente excluyentes. 
La probabilidad de que ocurra A o B, es decir, la probabilidad de que salga 
5 0 AS es: 


P(AUB)=P(A)+PB)=+L=3 


P(AUB) = 5 


En el experimento de sacar una carta, el evento no obtener un AS, es el 
complemento del evento A: obtener un AS, entonces resulta más simple 
calcular la probabilidad de A“ como 1 — P(A): 


P(A9) = 1 — P(A) 


zj A 
=1=3 
sie 
=]1 1 
P(aS) = E 
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s [ si ACB #0 entonces P(ALB) = PA) + PE) —P(ADB) | 


En el experimento del lanzamiento de un dado, los eventos 


A: Obtener un número par, y B: Obtener un número primo, 


son eventos no disjuntos, ya que AMB = {2}, entonces la probabilidad 
del evento A o B es: 


P(AUB) = P(A) + P(B) - (ANB) 


A AN 
“e 4 


6 
P(AUB) = > 


= SIA y B son eventos independientes, es decir, que la ocurrencia de A 
no influye en la ocurrencia de B, entonces: 


Si lanzamos un dado dos veces, los eventos A: Obtener un número par 
en el primer lanzamiento, y B: Obtener 1 en el segundo lanzamiento, 
son eventos independientes, puesto que la probabilidad de un resultado 
en el segundo lanzamiento no cambia por lo que haya resultado en el 
primero, entonces, la probabilidad de: Obtener un número par en el 
primer lanzamiento y 1 en el segundo, es: 


P(ANB) = P(A)P(B) 


P(ANB) = b 


Si A y B son eventos independientes, entonces el evento A/B se 
lee: Ocurre el evento A dado que ha ocurrido B, y tiene la siguiente 
probabilidad: 


Es decir, la probabilidad de que ocurra el evento A, dado que ha ocurrido 
B, es igual a la probabilidad de que ocurra el evento A, puesto que A y B 
son independientes. 
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Si lanzamos una moneda dos veces consecutivas, la probabilidad P(A/B), 
sabiendo que los eventos son: 


A: Obtener cara en el segundo lanzamiento, y B: Obtener sello en el 
primero, es: 


P(A/B) = P(A) = > 


= SIA y B son eventos dependientes, es decir, la ocurrencia de A influye 
en la ocurrencia de B, entonces: 


P(ANB) = P(A) : P(B/A) 


Que representa la probabilidad del evento B, dado que ha ocurrido A. 

En el experimento de la extracción de una carta: ¿cuál es la probabilidad 
de que la carta extraída sea la reina de trébol, dado que la carta extraída 
es también de trébol? 


Queremos calcular P(reina/trébol) 


La probabilidad de “reina y trébol” es 5 
La probabilidad de “trébol” es > 


P(reina/trébol) 
P(trébol) 


Así pues, P(reina/trébol) = 


P(reina/trébol)= 13 


Para ciertos experimentos aleatorios, se pueden representar de manera 
gráfica todos los resultados posibles del experimento, que consiste en la 
iteración de un experimento sencillo, mediante un diagrama de árbol. 
Este tipo de representación permite obtener una técnica de conteo. 
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Ejemplo 11.29 Diagrama de árbol. 


Is Resultados 
Segundo Lanzamiento 


Lanzamiento 


Primer 
Lanzamiento 
Cc 
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Se seleccionan al azar dos cartas entre diez cartas numeradas del 1 a 
10. Hallar la probabilidad de que la suma sea impar si: 


a) Se sacan una tras otra sin sustitución. 
b) Las dos cartas se sacan una después de la otra con sustitución. 


Solución: 


a) Sea A: El evento en el que la suma sea impar si las dos cartas se 
sacan una tras otra sin sustitución. 


De acuerdo al principio multiplicativo, hay (1019) = 90 maneras 
diferentes de sacar dos cartas, una primero que la otra sin 
sustitución. Como existen (515) = 25 maneras de escoger primero 
un número par y luego uno impar, también existe 25 maneras de 
escoger primero un número impar y luego uno par; tenemos: 
2525 A) 
HA) HARO SR 9, 
A a 

b) Sea B: El evento en el que la suma sea impar si las dos cartas se 

sacan una tras otra con sustitución. 


Hay (10)(10) = 100 maneras diferentes de seleccionar dos cartas, 
una después de la otra con sustitución. Según lo mencionado en 
el literal (b) existen (5)(5) = 25 maneras de sacar un número par y 
luego uno impar, y (5X5) = 25 maneras de sacar un número impar 


254253 WT 0 
w wo 


y luego uno par; entonces P(B) = 


Para inventario se asignan códigos numéricos de productos de cuatro 
cifras a cada artículo existente en una bodega. Suponiendo que todos 
los números son agotados en la numeración, y si se escogiera un 
artículo al azar, determine: 


a) La probabilidad de que los dos últimos dígitos asignados a ese 
artículo sean pares. 


b) La probabilidad de que los dígitos asignados a dicho artículo sean 
diferentes. 


c) La probabilidad de que los dígitos asignados a dicho artículo sean 
impares. 


Solución: 
El números de códigos diferentes para los artículos (10)(10)(10)(10)= 10000. 


a) Sea A: El evento en el que los dos últimos dígitos asignados a ese 
artículo sean pares. 


El número posible de códigos con los dos últimos dígitos pares, 
aplicando el principio multiplicativo, es: (10)(10(515) = 2500. 


Toan ? 
P(A) = -opp = 0.25 S 25% 


b) Sea B: El evento en el que los dígitos asignados a dicho artículo 
sean diferentes. 


El número posible de códigos con dígitos diferentes, aplicando el 
principio multiplicativo es (10)1(9(8)(7) = 5040. 


_ 5040 _ : 
P(A) = -00g 70-504 > 50.4% 


c) Sea C: El evento en el que el código de los artículos tenga asignado 
sólo dígitos impares. 


El número posible de códigos con dígitos impares aplicando el 
principio multiplicativo, es (5)(5)(5)(5) = 625. 


n ; 
P(C)==0000 = 0.0625 > 6.25% 


Se tienen 15 calculadoras, de las cuales 5 son defectuosas. Si se 
escogen 3 al azar, hallar la probabilidad de que: 

a) Ninguna sea defectuosa. 

b) Una exactamente sea defectuosa. 

c) Una por lo menos sea defectuosa. 


Solución: 


Existen C= (E = 455 maneras diferentes de escoger 3 calculadoras 


entre las 15 existentes. 
a) Sea A: El evento de no escoger calculadoras defectuosas. 


Puesto que hay 15 — 5 = 10 calculadoras no defectuosas, entonces 
hay CH (19) = 120 maneras diferentes de escoger 3 calculadoras 
no defectuosas. Así que: 


ZO ZA o 
PA) =355= 91 > 26% 


b) Sea B: El evento de escoger exactamente una calculadora 
defectuosa. 


10 
2 
de escoger calculadoras no defectuosas; por el principio multiplicativo 
hay (5)1(45) = 225 maneras de escoger 3 calculadoras, de las cuales 
sólo una es defectuosa. Entonces : 


Hay 5 calculadoras defectuosas y c= ( J= 45 maneras diferentes 


SNO 
ro el- gp- ipeo 


c) El evento en que por lo menos una sea defectuosa, es el complemento 
del evento en que ninguna es defectuosa, entonces: 


PAS =1-P(A)=1-24= Lo 74% 


Seis parejas de casados se encuentran en un cuarto. Si se escogen 2 
personas al azar, hallar la probabilidad de que: 


a) Sean esposos 
b) Una sea hombre y otra sea mujer. 


Solución: 


Existen Y= 5) = 66 maneras diferentes de escoger 2 personas de 
las 12. 


a) Sea A: El evento de seleccionar una pareja de casados. 


Hay 6 parejas de casados, entonces existen a = ($) = 6 maneras 


diferentes de escoger a una pareja de casados; por lo tanto: 


PAa)= £=} e9. 


b) Sea B: El evento de seleccionar dos personas, tal que una sea 
hombre y la otra sea mujer. 


Como hay 12 personas, 6 hombres y 6 mujeres, hay 6 maneras 
diferentes de escoger un hombre y 6 maneras diferentes de escoger 
una mujer; por consiguiente: 


Pe - LO -6 55%, 


En un concurso de belleza conformado por 10 participantes, 3 tienen 
ojos azules. Si se escogen dos participantes al azar, hallar la probabilidad 
de que: 


a) Las dos tengan ojos azules. 
b) Una tenga ojos azules. 


Solución: 


a) Sea A: El evento en el que las participantes seleccionadas tengan 
ojos azules. 


Como existen 10 participantes, existen C!?= (4 =45 maneras de 
seleccionar a dos de ellas. Debido a que el evento es que las dos 
participantes seleccionadas tengas ojos azules, su probabilidad sería: 


DI 
(19) un E 15 > 6.67%. 
2 


P(A)= 


b) Sea B: El evento en el que una de las participantes tenga ojos 
azules. 


317 
P(B) = a = 2L Lo 46.6%. 
2 


Un grupo de amigos, tres hombres y tres mujeres, deciden ir a ver una 
película; una vez en la sala de cine, consideran sentarse todos en una 
sola fila. Hallar la probabilidad de que: 


a) Las tres mujeres se sienten juntas. 
b) Los hombres y las mujeres se sienten alternados. 


Solución: 
a) Sea A: El evento en el que las mujeres se sienten juntas. 


Existen 6 personas en general, lo cual quiere decir que se necesita 
una fila con 6 asientos disponibles. 


Existen 4 posibilidades de tres asientos consecutivos: (1, 2, 3), (2, 3, 4), 
(3, 4, 5), (4, 5, 6), que serían los asientos ocupados por las mujeres. 
Como hay 720, es decir 6!, maneras diferentes de que se sienten 
los 6 amigos, y existen 3! maneras de que se sienten las 3 mujeres 
en cada posibilidad de tres asientos consecutivos, y a su vez los 
3 hombres tienen 3! maneras de sentarse en los tres asientos 
restantes, entonces: 


(M696) _ 1 
6! 


P(A) = - 


3 20%. 


b) Sea B: El evento en el que las mujeres y los hombres se sienten de 
forma alternada. 


Hay 6! = 720 maneras de sentarse los seis amigos en los asientos 
disponibles. De acuerdo al orden alternado y a la ubicación, podemos 
plantear la situación en la siguiente figura. 


Asientos: 


1 2 3 4 5 6 
Alternabilidada H M H M H M 
de los amigos M H M H M H 


Como se puede observar en la figura, existen 2 formas distintas de 
alternar a los amigos, en las cuales les corresponde 3 asientos a los 
hombres y 3 a las mujeres; entonces existen 3! maneras diferentes de 
sentarse, tanto para las mujeres como para los hombres, por lo tanto: 


Cea 2 1 10% 


20-10 


En cierto curso, 25% de los estudiantes reprobaron matemáticas, 15% 
reprobaron física y 10% reprobaron ambas materias. Se selecciona un 
estudiante al azar: 


a) Si reprobó física, ¿cuál es la probabilidad de que reprobó 
matemáticas? 

b) Si reprobó matemáticas, ¿cuál es la probabilidad de que reprobó 
física? 

c) ¿Cuál es la probabilidad de que reprobó matemáticas o física? 


Solución: 


Sea M = [estudiantes que reprobaron matemáticas; y 
F = {estudiantes que reprobaron física}; entonces: 


P(M) = 0.25 P(F)=0.15 P(MAF)=0.10 


a) La probabilidad de que el estudiante reprobara matemáticas, dado 
que haya reprobado física, es: 


AMA OI a 
P(M/F) = E S 67%. 


b) La probabilidad de que el estudiante reprobara física, dado que haya 
reprobado matemáticas, es: 


RE OO 2 0 
P(F/M) = PM 7023573 S 40%. 


c) P(MUF)=P(M)+P(F)-P(MOF)=0.25+0.15-0.10=0.30=57 530%. 


Es un triángulo que representa una regularidad numérica de la siguiente forma: 


¿Se da cuenta de cómo se forman los números en cada fila? 


Es posible relacionarlos números que se obtienen en cada línea del triángulo de 
Pascal con el número de veces de la ocurrencia de un evento determinado, en 
un experimento aleatorio sencillo que consiste en dos sucesos equiprobables, 
tales como el lanzamiento de una moneda (cara/sello), género de un hijo 
(masculino/femenino), entre otros. 


Calcular el número de casos en que se obtiene tres caras y un sello al 
lanzar cuatro veces una moneda. 


Solución: 


Se puede calcular mediante el triángulo de Pascal. Observe la siguiente 
sucesión de potencias del binomio (c + s): 


(c+s) = C+E 


(c +s} = c? + 2cs + s? 
(c +s} = c? + 30?s + 3cs? + s? 


(c +s) = c4 + 4c?s + 6c?s? + 4cs? + s4 


Los coeficientes de los términos en el desarrollo de cada una de estas 
potencias, son los números del triángulo de Pascal. ¿Podría usted desarrollar 


la siguiente potencia y generalizar sus conclusiones para (c + s)”? 


En el desarrollo de (c + s)*, el término 4c*s representa 4 casos favorables 
para el resultado de tres veces cara (cî) y una vez sello (s): cecs - cese 
- CSCC - SCCC. 


Análogamente, 6c?s? representa 6 casos favorables para el resultado de dos 
veces cara (c?) y dos veces sello (s?). 


Considere el siguiente experimento aleatorio: lanzar un dado tres veces. 
¿Es conveniente apostar a favor o en contra de obtener al menos una 
vez el 5? 


Solución: 


Como el experimento consta de tres eventos que son independientes 
entre sí, el número de casos posibles es (6)1(6)(6) = 216. 


Sea A: ninguna vez se obtiene el 5, el número de casos favorables para 
este evento es (5)(5)(5) = 125 


UPON o 
P(A)= 216 0.58 S 58%. 
Para el evento AC: Alguna vez se obtiene el 5, su probabilidad es: 
P(AS) = 1 —- P(A) = 1 — 0.58 = 0.42 £ 42%. 


Por lo tanto, no conviene apostar a favor debido a que la probabilidad 
de ganar es menor a la de perder. 


Consideremos una caja de dos bolitas blancas y tres bolitas negras. 
Extraemos una de ellas al azar y después otra. Calcule la probabilidad 
de obtener una bolita blanca y una bolita negra, si: 


a) Después de sacar la primera bolita, ésta se devuelve a la caja. 
b) Después de sacar la primera bolita, ésta no se devuelve a la caja. 
Solución: 


a) En este caso, los eventos son independientes. 
Número de casos posibles = (5)(5) = 25. 
Número de casos favorables = (2)1(3) + (3)\(2) = 12. 
(una blanca y una negra o una negra y una blanca). 


P(A) = E > 48%. 


ES 


b) En este caso, los eventos son dependientes. 


Número de casos posibles = (5)(4) = 20. 
Número de casos favorables = (2)(3) + K€)G) = 12. 


PB)-4-2 6 60%. 


onen ro- GGG- 


En el juego de la ruleta, una bola puede caer en cualquiera de las 37 
casillas, que son sectores circulares iguales, numerados del 0 al 36. 
Hay 18 casillas rojas, 18 negras y una blanca (la del 0). En el juego 
gana el número de la casilla en que cae la bola, después de hacerla 
girar libremente y detenerse por sí sola. ¿Cuál es la probabilidad de 
que la bola caiga en una casilla numerada con un número par mayor 
que 29? 


Solución: 


Como la bola puede caer en cualquiera de las casillas, los casos posibles 
son 37. 


Los números (o casillas) mayores que 29 son: 
30 - 31 - 32 - 33 - 34-35-36. 
De ellos, son números pares: 30, 32, 34 y 36. 


Por lo tanto, los casos favorables son 4 y la probabilidad requerida es 11%. 


La probabilidad de que un alumno haya aprobado la parte teórica del 
examen para obtener licencia para conducir es 0.68; la probabilidad de 
que haya aprobado el examen práctico es 0.72; y, la probabilidad de 
que haya aprobado alguna de las dos partes es 0.82. Elegido un alumno 
al azar, encuentre la probabilidad de que haya aprobado el examen 
para obtener licencia. 


Solución: 

Para obtener la licencia, cualquier persona debe aprobar ambas partes 
del examen: la teórica y la práctica. Nos preguntan entonces, por la 
probabilidad de que una persona elegida al azar haya aprobado las dos 
partes del examen. 


Si denominamos: 


A: Aprobar la parte teórica. 
B: Aprobar la parte práctica. 


Debemos calcular la probabilidad de A y B, o bien: P(A A B). Sabemos 
que P(A U B) = P(A) + P(B) - P(A A B). Si despejamos P(A N B), tenemos: 


P(A ^ B) =P(A) + P(B) - P(A U B) 


Del enunciado, tenemos que: 

P(A) = 0.68, P(B) =0.72 y P(A U B) = 0.82, 
Reemplazando en la ecuación anterior, se tiene: 
P(A N B) = 0.68 + 0.72 — 0.82, de donde 

P(A N B) = 0.58 


Por lo tanto, la probabilidad que un alumno elegido al azar obtenga su 
licencia es 58%. 


Existen tres cajas que contienen unidades de CD-ROM, de acuerdo al 
siguiente detalle: 


Caja I: contiene 10 CD-ROM, de los cuales 4 son defectuosos. 
Caja Il: contiene 6 CD-ROM, de los cuales 1 es defectuoso. 
Caja III: contiene 8 CD-ROM, de los cuales 3 son defectuosos. 


Si se escoge al azar una caja y luego sacamos al azar un CD-ROM. 
¿Cuál es la probabilidad de que el CD-ROM sea defectuoso? 


Solución: 
Aquí realizamos una serie de dos experimentos consecutivos: 
a) Escoger una de las tres cajas. 


b) Escoger un CD-ROM que sea defectuoso o no defectuoso. 


El siguiente diagrama de árbol describe cada experimento consecutivo, 
en donde cada rama es un experimento y la probabilidad de cada rama 
del árbol se coloca según cada caso: 


Defectuoso 


I 


Wi= 


No defectuoso 


2 
5 
3 
S 
TI Defectuoso 
6 
TI 5 
6 
No defectuoso 
3 
8 
2 
8 


Wi 


w|— 


Defectuoso 


HI 


No defectuoso 


La probabilidad de que una trayectoria del árbol suceda es, según el 

principio multiplicativo, el producto de las probabilidades de cada rama 

de la trayectoria, o sea, que la probabilidad de escoger la caja I y luego 
E 1) (2) SiO 

un CD-ROM defectuoso es E 5 15" 

Ahora, como hay tres trayectorias mutuamente exclusivas que conducen 

a un CD-ROM defectuoso, por el principio aditivo, la suma de las 

probabilidades de estas trayectorias es la probabilidad buscada, así: 


PEOR ee a a 


Tres empresas de comercialización, A, B y C, han solicitado a los 
egresados de Auditoría de la ESPOL, realizar una auditoría de sus 
estados contables. Se sabe que la empresa A tiene 180 estados 
contables, mientras que la B y la C tienen 250 y 300, respectivamente. 
Se sabe también que 18 estados contables de la A tiene errores, 20 de 
los de B tiene errores y 33 de los de C también tiene errores. Suponiendo 
que los estudiantes auditores hacen el trabajo correctamente, y se 


escoge al azar un estado contable: a) ¿Cuál será la probabilidad de 
que éste tenga errores? b) Si el estado contable escogido no contiene 
errores, ¿cuál será la probabilidad de que provenga de la empresa B? 
Solución: 

Sean los eventos: 

A: Seleccionar un balance de la empresa de comercialización A. 


B: Seleccionar un balance de la empresa de comercialización B. 
C: Seleccionar un balance de la empresa de comercialización C. 


E: En el que el estado contable seleccionado tenga errores. 
S: En el que el estado contable seleccionado no tenga errores. 


PAnE) =È 


0 
ran s)- 22 
_BNE) == 
PB NnS)= 20 
PCB =2i 
PC ns)= 527 


a) De acuerdo al evento E y por el principio aditivo: 
BOD = 00 = 0:02 0:04:01 10% 
b) Sea S: El evento en el que el estado contable seleccionado no tenga errores. 


P(S) = 1 — 0.1 = 0.9 S 90% 


HBOS) _ 0315 0935 035%. 


O 


CAPÍTULO ONCE Ejercicios propuestos O D 


Para los ejercicios de las secciones 11.2, 11.3, 11.4 y 11.5, considere los 
siguientes conjuntos de datos A, B y C, respectivamente. 


A. Edad en años de B. Notas de los estudiantes C. Tiempo de espera en 
estudiantes en etapa colegial | de un curso de Cálculo en la | minutos de los clientes de un 
ESPOL banco de la localidad 
16 6.45 40 
12 8.30 45 
12 MESS 52 
11 6.00 33 
19 8.20 27 
16 6.25 5 
17 6.00 11 
11 7.00 31 
16 6.40 42 
9 7.45 51 
17 6.20 55 
16 6.35 55 
12 6.55 60 
13 7.80 42 
10 6.00 37 
16 6.45 35 
17 7.95 10 
14 6.00 43 
17 6.15 54 
16 7.05 30) 
18 LS 10 
13 6.25 22 
14 6.00 5 
13 6.45 62 
13 6.60 74 
13 9.15 57 
14 6.60 42 
17 7.60 43 
14 6.35 31 
12 7.30 26 
14 7.40 29 
ils 8.15 35 
14 6.70 33 
13 6.25 41 
17 6.40 39 
10 6.45 44 
15 8.30 54 
15 7.55 56 
12 6.00 22 
14 8.20 15 
13 6.25 32 
10 6.00 17 
12 7.00 26 
16 6.40 42 
12 7.45 44 
14 6.20 45 
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11.2 Organización de datos 


1. Con cada uno de los conjuntos de datos dados: 


a) Construya una tabla de frecuencias estimando un número de intervalos 
adecuado. 

b) Complete la tabla con las frecuencias: absoluta, absoluta acumulada, 
relativa y relativa acumulada. 

c) Calcule la marca de clase para cada intervalo. 

d) Formule al menos cuatro interpretaciones expresándolas con sus propias 
palabras. Discútalas con sus compañeros y analice su validez. 


11.3 Gráficos de representación 


2. Con cada uno de los conjuntos de datos dados: 


a) Construya el histograma de frecuencias. 

b) Construya la poligonal de frecuencias. 

c) Formule al menos cuatro interpretaciones que puedan ser sustentadas 
con los gráficos construidos. 


3. Con los datos del grupo B, construya un diagrama de tallo y hojas. 


11.4 Medidas de tendencia central 


4. Para cada uno de los conjuntos de datos dados: 


a) Calcule los estadísticos de tendencia central. 

b) Describa los cuartiles y deciles. 

c) Formule al menos cinco interpretaciones que puedan ser sustentadas 
con la información obtenida en los literales anteriores. 


5. Analice la ubicación de los estadísticos obtenidos en el ejercicio anterior 
respecto al histograma de frecuencias. 


11.5 Medidas de dispersión 


6. Para cada uno de los conjuntos de datos dados: 


a) Calcule los estadísticos de dispersión. 
b) Formule al menos tres interpretaciones que puedan ser sustentadas con 
la información obtenida en el literal anterior. 


11.6 Probabilidades 


7. En el experimento de lanzar dos dados y el resultado es la multiplicación 
de los dos números obtenidos, determine: 
a) El espacio muestral. 
b) La probabilidad de que el resultado sea 12. 
c) La probabilidad de que el resultado sea menor que 10. 
d) Discuta si los dos eventos anteriores son equiprobables. 
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8. 


10. 


11 


En un concurso se deben obtener aleatoriamente dos dígitos del 1 al 5, de 
manera independiente. Si la suma de los dos dígitos es par, el participante 
gana $100; si la suma de los dos dígitos es impar, gana $10. 


a) Escriba el espacio muestral para este concurso. 

b) Encuentre la probabilidad de que el participante gane $100 en un 
intento. 

c) ¿Le recomendaría este juego a alguien? ¿Por qué? 


Se pregunta a tres personas distintas, elegidas al azar, si son partidarias o 
no de un determinado candidato a la Presidencia de la República. 


a) Determine el espacio muestral asociado a dicho experimento, utilizando 
la letra “s” para las respuestas afirmativas y “n” para las negativas. 

b) Calcule la probabilidad de que al menos una persona es partidaria del 
candidato. 

c) Calcule la probabilidad de que ocurra el evento contrario al del literal 
anterior. 


Se pregunta a cuatro personas elegidas al azar que consumen carnes, si 
les gusta la carne de cerdo. 


a) Determine el espacio muestral asociado a dicho experimento, utilizando 
la letra “s” para las respuestas afirmativas y “n” para las negativas. 

b) Calcule la probabilidad de que al menos tres personas gusten de la 
carne de cerdo. 

c) Calcule la probabilidad de que, a lo mucho, sólo a dos personas les 
guste la carne de cerdo. 


.Discuta el siguiente problema: Tengo dos urnas, dos bolas blancas y dos 


bolas negras. Se desea saber cómo debo distribuir las bolas en las urnas 
para que, al elegir una urna al azar, sea máxima la probabilidad de obtener 
una bola blanca. La única condición exigida es que cada urna tenga al 
menos una bola. 


11.7 Conjuntos y Probabilidades 


12. 


Las estadísticas de accidentes de tránsito indican que el 80% de la población 
ha sufrido algún tipo de accidente. El 60% ha sufrido daños en su vehículo 
y el 35% ha sufrido daños físicos. Determine la probabilidad de que un 
conductor sufra los dos tipos de daños. 
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13. 


14. 


15. 


16. 


Mediante un estudio de opinión, se estableció que las tres características 
preferidas por el electorado sobre un candidato a la Alcaldía son: 


e Hombre (H) e Sin afiliación política (N) e Casado (C) 


Se sabe que el 75% de los encuestados prefieren un candidato de género 
masculino, el 60% lo prefiere sin afiliación política, el 70% prefiere que sea 
casado, el 90% prefieren que sea hombre o sin afiliación política, el 85% 
prefiere que sea hombre o casado, el 95% prefiere que sea sin afiliación 
política o casado, el 99% prefiere alguna de las tres características para el 
candidato. 


Construya un diagrama de Venn para representar las tres características. 


Cuál es la probabilidad de que una persona: 

a) Prefiera las tres características. 

b) No prefiera alguna de las tres características. 
c) Prefiera que sólo sea casado. 


A través de una encuesta se determinó que el 80% de los habitantes se 
informa diariamente de las noticias viendo la televisión, el 40% se informa 
por el periódico y el 30% por ambos medios. Determine: 


a) La probabilidad de que una persona de esa ciudad no se informa por 
alguno de estos medios. 

b) La probabilidad de que una persona que se informó por la televisión 
haya leído el periódico. 

c) Sabiendo que una persona leyó el periódico, ¿cuál es la probabilidad de 
que no vio los noticieros? 


Mediante una encuesta, se ha determinado que el 80% de las compras 
diarias en cierto supermercado son realizadas por mujeres. De este grupo, 
el 70% compra algún producto en promoción, mientras que del grupo de 
los hombres, sólo el 10% compra productos en promoción. 


a) Determine la probabilidad de que el almacén venda diariamente algún 
producto en promoción. 

b) Si se selecciona una venta al azar y no contiene productos en promoción, 
¿cuál es la probabilidad que la compra haya sido hecha por una mujer? 
¿Y por un hombre? 


Cierta cooperativa de ahorros ha observado que la probabilidad de que 
un préstamo sea cancelado es del 70% si el prestamista es de género 
femenino. La proporción de ahorristas hombres respecto a mujeres es de 
1. Determine la probabilidad de que un ahorrista pague un préstamo y sea 
de género femenino. 
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17. 


18. 


19. 


20. 


Cierto concurso consiste en obtener aleatoriamente un número divisible 
para 10 de todos los números enteros comprendidos del 1 al 40. 


Si el número obtenido es divisible para 10, el participante recibe el llavero 
A; en caso contrario, recibe el llavero B. A continuación, se escoge una 
llave. El llavero A contiene 3 llaves de un vehículo y 7 llaves que no 
corresponden al vehículo. El llavero B tiene 2 llaves del vehículo y 10 que 
no lo son. 


Encuentre: 


a) La probabilidad de que la llave extraída sea del vehículo. 
b) La probabilidad de que la llave extraída sea del vehículo y pertenezca 
al llavero B. 


Cierto empresario requiere decidir sobre la mejor opción para elevar sus 
ventas. Existen dos situaciones, A y B, que afectan su mercado. La situación 
A tiene una probabilidad de ocurrir igual a 0.4, y la B de 0.6. En ambas 
situaciones puede invertir en un anuncio. Si ocurre A, la probabilidad de 
invertir en un anuncio es de 0.8, y si ocurre B, la probabilidad es de 0.3. El 
empresario desea invertir en el anuncio. Determine: 


a) La probabilidad de que el empresario invierta en el anuncio. 

b) La probabilidad de que el empresario no invierta en el anuncio. 

c) ¿Qué recomendaría usted si el evento A es una situación que favorece 
sus ventas? 


Considere que 0.076 es la probabilidad de que cuatro clientes diferentes 
compren un televisor con pantalla plana en un almacén. Determine: 


a) La probabilidad de que uno de ellos compre un televisor con pantalla 
plana. 

b) La probabilidad de que al menos dos de ellos compren un televisor con 
pantalla plana. 


Un examen consta de 6 preguntas. Cada pregunta tiene cinco opciones, 
de las cuales sólo una es la respuesta correcta. El número mínimo de 
preguntas que un estudiante debe contestar correctamente para aprobar 
el examen es 4. Determine la probabilidad de que un estudiante apruebe 
el examen contestando al azar las preguntas. 


pág. 931 


